机器学习笔记—增强学习
本文介绍增强学习和自适应控制。 在监督学习中,算法是要输出尽量模仿训练集中的标签 y,标签给每个输入 x 一个清楚的正确答案。与此不同,对于许多序列决策和控制问题,就很难对算法给出这种明确的监督。例 ...
本文介绍增强学习和自适应控制。 在监督学习中,算法是要输出尽量模仿训练集中的标签 y,标签给每个输入 x 一个清楚的正确答案。与此不同,对于许多序列决策和控制问题,就很难对算法给出这种明确的监督。例 ...
选自《Reinforcement Learning: An Introduction》, version 2, 2016, Chapter2 https://webdocs.cs.ualberta. ...